Análisis de Extremos de Precipitación

Ajuste estadístico de máximos anuales de precipitación

✓ Esperando datos

Resumen Estadístico

Ver datos cargados

Serie Temporal

Diagrama de Caja

Detección de Posibles Outliers


Método del Water Resources Council basado en transformación logarítmica.


Los valores identificados deben ser verificados por el técnico responsable. Pueden ser errores de medición o eventos extremos válidos.

Identificación Visual de Outliers

Ajuste de Distribuciones

ℹ️ ⚠️ Los resultados de ajuste son orientativos. Datos con alta variabilidad, outliers extremos o series cortas pueden estar fuera del rango de aplicación de algunas distribuciones. Verifique siempre los resultados con criterio profesional.

Parámetros Ajustados


Test de Kolmogorov-Smirnov

Por defecto se aplica α = 0,20, equivalente a un nivel de confianza del 80 %. Para cada dato ordenado se calcula la posición de Weibull P(xᵢ) = i/(n+1) y Δ = máx |F(xᵢ) - P(xᵢ)|.

ℹ️ Para n ≤ 35 se emplean los valores críticos tabulados del libro de Hidrología Estadística; cuando el tamaño no figura expresamente se interpola entre las dos filas tabuladas contiguas. Para n > 35 se utiliza Δcrítico = c(α)/√n.

Visualización de Ajustes

Probabilidad empírica de Weibull vs CDF ajustadas

Histograma y funciones de densidad

Gráfico Q-Q


Cálculos realizados

Cuantiles para Periodos de Retorno


Personalización del gráfico


Divergencia entre Distribuciones


Calculadora de Cuantiles

? Introduzca uno o varios periodos separados por comas (ej: 50, 100, 500)

Selección de Cuantiles

PRECIPITACIONES MAXIMAS EN 24 HORAS (mm)
RESUMEN DE LOS DISTINTOS AJUSTES

Valor seleccionado

Exportar

Asistente IA

La clave se mantiene únicamente en memoria durante esta sesión.
Active el asistente e introduzca una pregunta sobre los datos y resultados calculados.

El informe se construye exclusivamente con los datos y resultados calculados en la aplicación.

Documentación Metodológica

Esta aplicación ajusta distribuciones de probabilidad a series de precipitación máxima anual mediante distintos métodos. A continuación se describen brevemente las distribuciones y métodos implementados.

Distribuciones de probabilidad

Normal — Método: MLE

\( f(x)=\frac{1}{\sigma\sqrt{2\pi}}\exp\left[-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2\right] \)

Dos parámetros: media \(\mu\) y escala \(\sigma\).

Gumbel (Valores Extremos Tipo I) — Métodos: MLE, MOM, PWM

\( F(x)=\exp\left[-\exp\left(-\frac{x-u}{\alpha}\right)\right] \)

Dos parámetros: localización \(u\) y escala \(\alpha>0\). Caso particular de la GEV con \(k=0\).

GEV (Generalizada de Valores Extremos) — Métodos: MLE, MOM, PWM

\( F(x)=\exp\left\{-\left[1-k\,\frac{x-u}{\alpha}\right]^{1/k}\right\} \)

Tres parámetros: localización \(u\), escala \(\alpha>0\) y forma \(k\).

  • \(k<0\) → Fréchet (cola pesada), caso habitual en precipitación extrema.
  • \(k>0\) → Weibull (cola acotada).
  • \(k\to0\) → se reduce a Gumbel.

Log-Normal — Método: MLE

\( F(x)=\Phi\left(\frac{\ln x-\mu_{\ln}}{\sigma_{\ln}}\right) \)

La variable \(\ln(x)\) sigue una distribución normal con media \(\mu_{\ln}\) y desviación típica \(\sigma_{\ln}\).

Log-Pearson III — Método: MOM

Se aplica la distribución Pearson III a \(Y=\log_{10}(x)\):

\( f(Y)=\frac{1}{\alpha^\tau\Gamma(\tau)}(Y-u)^{\tau-1}\exp\left(-\frac{Y-u}{\alpha}\right) \)

Tres parámetros en espacio logarítmico derivados del sesgo, media y desviación típica de \(Y\).

SQRT-ETmax (Etoh, 1987) — Métodos: máxima verosimilitud, L-momentos y Zorraquino

\( F(x)=\exp\left[-k\left(1+\sqrt{\alpha x}\right)\exp\left(-\sqrt{\alpha x}\right)\right] \)

Dos parámetros: forma \(k>0\) y escala \(\alpha>0\). La máxima verosimilitud resuelve las ecuaciones de verosimilitud; el ajuste por L-momentos iguala numéricamente los L-momentos muestrales y teóricos; Zorraquino obtiene \(k\) y \(\alpha\) mediante aproximaciones polinómicas en función del coeficiente de variación.

TCEV (Two Component Extreme Value) — Método: MLE

\( F(x)=\exp\left[-\lambda_1e^{-\theta_1x}-\lambda_2e^{-\theta_2x}\right] \)

Cuatro parámetros que representan dos poblaciones superpuestas: eventos ordinarios \((\lambda_1,\theta_1)\) y extraordinarios \((\lambda_2,\theta_2)\).

SQRT-ETmax: método de Zorraquino

El método de Zorraquino es un procedimiento aproximado para estimar los parámetros \(k\) y \(\alpha\) de la distribución SQRT-ETmax a partir de la media \(\bar{x}\), la desviación típica muestral \(S\) y el coeficiente de variación \(CV=S/\bar{x}\).

\[ \ln(k)=\sum_{i=0}^{6}a_i[\ln(CV)]^i,\qquad \ln(I_1)=\sum_{i=0}^{6}b_i[\ln(k)]^i \]
\[ \alpha=\frac{k}{1-\exp(-k)}\,\frac{I_1}{2\bar{x}} \]

Los coeficientes \(a_i\) y \(b_i\) cambian en los intervalos \(0{,}19\le CV<0{,}30\), \(0{,}30\le CV<0{,}70\) y \(0{,}70\le CV\le0{,}99\). Fuera de ese rango la aplicación no realiza el ajuste, porque la aproximación no es metodológicamente aplicable.

Coeficientes polinómicos empleados
Intervalo de CVCoeficiente0123456
0,19 ≤ CV < 0,30aᵢ-1765,86-7240,6-11785,6-9538,0-3834,3-612,680
bᵢ-0,9315082,156709-0,7797700,112962-0,0093400,000412-0,000008
0,30 ≤ CV < 0,70aᵢ1,8015132,47376123,55620049,95727459,77563635,6968768,505713
bᵢ2,342697-0,149784-0,0993120,0034440,001014-0,0001410,000005
0,70 ≤ CV ≤ 0,99aᵢ1,318615-3,16463-1,59552-6,26911-11,3177-22,6976-22,0663
bᵢ2,307319-0,136674-0,075036-0,0134640,0032280,000521-0,000141

Trazabilidad: la aplicación muestra \(\bar{x}\), \(S\), \(CV\), el intervalo de coeficientes, \(I_1\), \(k\) y \(\alpha\). El método se mantiene separado de máxima verosimilitud y L-momentos.

Referencia metodológica: Carlos Zorraquino Junquera, “El modelo SQRT-ET MAX”, Revista de Obras Públicas, 151(3447), 2004, pp. 33-37. Los coeficientes prácticos empleados se corresponden con la ficha de aplicación difundida por la Universidad de Salamanca, que recoge cálculos posteriores del autor.

Métodos de ajuste

MLE (Maximum Likelihood Estimation) — Maximiza la verosimilitud de los datos observados para estimar los parámetros. Método más eficiente para muestras grandes.

MOM (Método de Momentos) — Iguala los momentos muestrales (media, varianza, asimetría) con los teóricos de la distribución.

PWM (L-Momentos) — Utiliza momentos ponderados por probabilidad (Hosking, 1985). Más robusto que MOM para distribuciones de cola pesada y muestras pequeñas.

Gumbel-MOM: formulación asintótica y formulación corregida por n

La distribución de Gumbel se emplea habitualmente para representar máximos anuales. Su ajuste por momentos puede realizarse mediante una formulación asintótica o mediante una formulación corregida por el tamaño muestral \(n\). Esta corrección solo se aplica a Gumbel-MOM; no modifica Gumbel-MLE, Gumbel-L momentos ni ninguna otra distribución.

Formulación asintótica, sin corrección muestral

Utiliza los valores límite \(\mu_y=0{,}5772157\) y \(\sigma_y=1{,}2825\), sin coeficientes dependientes de \(n\). La desviación típica \(S\) se calcula con divisor \(n-1\).

\[ \alpha=\frac{1{,}2825}{S},\qquad \beta=\bar{x}-0{,}45S \]
\[ F=1-\frac{1}{T},\qquad y_T=-\ln[-\ln(F)],\qquad x_T=\beta+\frac{y_T}{\alpha} \]

Formulación corregida por n

Los coeficientes reducidos \(\mu_y\) y \(\sigma_y\) dependen de \(n\) y no proceden de una fórmula simple directa.

\[ \alpha=\frac{\sigma_y}{S},\qquad \beta=\bar{x}-\frac{\mu_y}{\alpha} \]
\[ F=1-\frac{1}{T},\qquad y_T=-\ln[-\ln(F)],\qquad x_T=\beta+\frac{y_T}{\alpha} \]

De forma equivalente:

\[ K_T=\frac{y_T-\mu_y}{\sigma_y},\qquad x_T=\bar{x}+K_TS=\bar{x}+\left(\frac{y_T-\mu_y}{\sigma_y}\right)S \]

Si \(n\) no coincide con una fila tabulada, se interpolan linealmente los dos tamaños muestrales más próximos:

\[ \mu_y(n)=\mu_{y1}+\frac{n-n_1}{n_2-n_1}(\mu_{y2}-\mu_{y1}) \]
\[ \sigma_y(n)=\sigma_{y1}+\frac{n-n_1}{n_2-n_1}(\sigma_{y2}-\sigma_{y1}) \]

Fuera del intervalo tabulado se emplean los valores asintóticos y se muestra una advertencia. Para muestras grandes, ambas variantes tienden a aproximarse.

Tabla de valores reducidos \(\mu_y\) y \(\sigma_y\)

Fuente: Aparicio Mijares, Francisco J. Fundamentos de Hidrología de Superficie, p. 264, tabla 9.6. Valores de \(\mu_y\) y \(\sigma_y\) para la distribución de Gumbel en función del tamaño muestral \(n\).

Referencia bibliográfica de la tabla \(\mu_y / \sigma_y\)

Fuente de la tabla de coeficientes \(\mu_y\) y \(\sigma_y\): Aparicio Mijares, Francisco J. Fundamentos de Hidrología de Superficie, página 264, tabla 9.6.

La tabla 9.6 recoge los valores de la media reducida \(\mu_y\) y de la desviación típica reducida \(\sigma_y\) de la distribución de Gumbel en función del tamaño muestral \(n\). Estos coeficientes se emplean para aplicar el ajuste Gumbel-MOM con corrección muestral.

Test de bondad de ajuste (Kolmogorov-Smirnov)

La aplicación utiliza el procedimiento de Smirnov-Kolmogorov empleado en hidrología estadística y en el proyecto de referencia. Se compara, para cada dato ordenado, la probabilidad teórica de la distribución ajustada con la probabilidad empírica calculada mediante la fórmula de Weibull.

Criterio aplicado por defecto
\( \alpha=0.20,\qquad 1-\alpha=0.80 \)
\( P(x_i)=\frac{i}{n+1},\qquad \Delta=\max_i\left|F(x_i)-P(x_i)\right| \)

El selector permite aplicar otros niveles de significación cuando el estudio lo requiera.

Apuntes visuales del método

Dos láminas para repasar las posiciones de trazado y la comparación con la distribución teórica.

Croquis conceptual y fórmulas de posiciones de trazado para el test de Kolmogorov-Smirnov
Lámina 1. Croquis conceptual, posiciones de trazado y significado de la máxima diferencia.
Ejemplo sencillo de aplicación de Weibull, Gringorten y Hazen antes de comparar con Gumbel
Lámina 2. Ejemplo ordenado paso a paso y recordatorio de fórmulas.
1 de 2

Para los datos válidos ordenados de menor a mayor:

\( x_1\leq x_2\leq\cdots\leq x_n,\qquad F(x_i)=P(X\leq x_i) \)

Se asigna a cada dato su número de orden \(i\) y su probabilidad experimental de Weibull:

\( P(x_i)=\frac{i}{n+1} \)
\( \Delta_i=\left|F(x_i)-P(x_i)\right|,\qquad \Delta=\max_i\Delta_i \)
\( z=\sqrt{n}\,\Delta,\qquad P(z)=1-K(z) \)

Para \(n\leq35\), el valor crítico \(\Delta_0\) se obtiene de la tabla del libro para el tamaño muestral y el nivel de significación seleccionados. Si el tamaño no aparece expresamente entre las filas publicadas, la aplicación interpola linealmente entre las dos filas contiguas. Para \(n>35\):

\( \Delta_0=\frac{c(\alpha)}{\sqrt{n}} \)

Si \(\Delta<\Delta_0\): no se rechaza \(H_0\); el ajuste se considera compatible con la muestra al nivel de significación seleccionado.

Si \(\Delta\geq\Delta_0\): se rechaza \(H_0\); debe probarse otra distribución o revisar el ajuste.

\(H_0\) es la hipótesis nula: la muestra puede considerarse compatible con la distribución teórica evaluada. No rechazarla no demuestra que la distribución sea verdadera; significa que el test no detecta diferencias suficientes para descartarla al nivel seleccionado.

¿Qué compara el test?

Compara \(P(x_i)=i/(n+1)\), probabilidad empírica de Weibull, con \(F(x_i)\), probabilidad acumulada de la distribución teórica ajustada. La mayor diferencia absoluta es el estadístico \(\Delta\).

¿Cómo se obtiene la probabilidad empírica?

Los datos se ordenan de menor a mayor. Al dato de orden \(i\) se le asigna \(P(x_i)=i/(n+1)\). Esta posición de Weibull evita asignar probabilidad cero al mínimo o uno al máximo y es la convención adoptada por la metodología hidrológica de referencia.

Ejemplo sencillo

Para \(n=5\) e \(i=3\), \(P(x_i)=3/6=0.50\). Si la distribución ajustada proporciona \(F(x_i)=0.55\), entonces \(\Delta_i=|0.55-0.50|=0.05\). El cálculo se repite para todos los registros y se selecciona la mayor diferencia.

Nivel de significación α y nivel de confianza

Por defecto se utiliza \(\alpha=0.20\), reproduciendo el criterio del proyecto de referencia. El nivel de confianza asociado es \(1-\alpha=0.80\), es decir, un 80 %.

Este criterio es más restrictivo que \(\alpha=0.05\), porque establece un valor crítico menor y exige una diferencia máxima más reducida.

\( n=28,\ \alpha=0.20:\quad \Delta_0\approx0.198 \)

El valor anterior se obtiene por interpolación entre las filas \(n=25\), \(\Delta_0=0.210\), y \(n=30\), \(\Delta_0=0.190\), de la tabla reproducida en el libro.

Valor crítico y constantes disponibles

Para \(n\leq35\) se utilizan los valores críticos tabulados. Para \(n>35\), \(n\) es el número de datos válidos, \(\alpha\) el nivel de significación y \(c(\alpha)\) la constante:

  • \(\alpha=0.20\) → \(c(\alpha)=1.07\)
  • \(\alpha=0.15\) → \(c(\alpha)=1.14\)
  • \(\alpha=0.10\) → \(c(\alpha)=1.22\)
  • \(\alpha=0.05\) → \(c(\alpha)=1.36\)
  • \(\alpha=0.01\) → \(c(\alpha)=1.63\)
Interpretación del resultado

Si \(\Delta<\Delta_0\), el test no detecta diferencias suficientes y se muestra «No se rechaza \(H_0\)». Si \(\Delta\geq\Delta_0\), la diferencia alcanza o supera el límite y se muestra «Se rechaza \(H_0\)».

La expresión correcta es «no se rechaza \(H_0\)», no «se acepta definitivamente la distribución».

Diferencia con Gringorten

El contraste utiliza Weibull:

\( P_{\mathrm{Weibull}}(x_i)=\frac{i}{n+1} \)

Gringorten, \(P(x_i)=(i-0.44)/(n+0.12)\), no interviene en el cálculo de \(\Delta\). Para mantener un criterio único, la aplicación actual también utiliza Weibull en las representaciones empíricas y en el gráfico Q-Q.

Elección del mejor ajuste

Cuando varias distribuciones no son rechazadas, la aplicación las ordena por menor \(\Delta\). El modelo con menor \(\Delta\) presenta la menor diferencia máxima entre la probabilidad teórica y la posición empírica de Weibull.

El K-S no debe ser el único criterio de selección: es poco sensible a las colas, precisamente relevantes en máximos anuales. También deben revisarse los cuantiles para periodos altos, los gráficos, la coherencia hidrológica y el criterio técnico.

Resumen operativo del cálculo
  1. Elimina valores nulos, vacíos, no numéricos o inválidos.
  2. Ordena los datos válidos de menor a mayor.
  3. Calcula \(P(x_i)=i/(n+1)\) y la probabilidad teórica \(F(x_i)\).
  4. Calcula \(\Delta_i=|F(x_i)-P(x_i)|\) y selecciona \(\Delta=\max\Delta_i\).
  5. Calcula \(z=\sqrt n\,\Delta\), \(P(z)=1-K(z)\) y el valor crítico tabulado o asintótico.
  6. Compara ambos valores y muestra si se rechaza o no se rechaza \(H_0\).
Detección de outliers (Water Resources Council)

Basado en el Bulletin 17B/C. Se trabaja en escala logarítmica:

\( Y_i=\log_{10}(x_i) \)

Los umbrales superior e inferior se calculan mediante:

\( Y_{\mathrm{sup}}=\overline{Y}+K_nS_Y,\qquad Y_{\mathrm{inf}}=\overline{Y}-K_nS_Y \)

donde \(K_n\) es un coeficiente tabulado que depende del tamaño muestral \(n\). Los valores fuera del rango \(\left[10^{Y_{\mathrm{inf}}},10^{Y_{\mathrm{sup}}}\right]\) se marcan como posibles outliers.

Cuantiles y periodo de retorno

El cuantil \(x_T\) asociado a un periodo de retorno \(T\) se obtiene como:

\( x_T=F^{-1}\left(1-\frac{1}{T}\right) \)

donde \(F^{-1}\) es la función cuantil (inversa de la CDF) de la distribución ajustada.

Interpretación: \(x_T\) es la precipitación que, en promedio, se iguala o supera una vez cada \(T\) años. No implica periodicidad; es una medida probabilística.